iT邦幫忙

2024 iThome 鐵人賽

DAY 9
0
自我挑戰組

從零開始學Python系列 第 9

[Day9] Python資料視覺化-Seaborn

  • 分享至 

  • xImage
  •  

Seaborn 是屬於 Python 中一種資料視覺化的工具,底層工具基本上屬於 Matplotlib,但比起 Matplotlib ,可以更加美化圖表來提升視覺美感。


安裝

pip install seaborn

導入

import seaborn as sns

各種圖表語法
• scatterplot(): scatter plot
• distplot(): histogram
• countplot(): bar plot
• boxplot(): box plot
• violinplot(): violin plot
• swarmplot(): swarm plot
• factorplot(): factor plot


外框、背景樣式選擇

  • 外框
    set_style():
    • Darkgrid
    • Whitegrid
    • Dark
    • White
    • Ticks
  • 背景
    set_context():
    • Paper
    • Notebook
    • Talk
    • Poster

匯入資料

  1. 使用csv檔案匯入:
    範例資料來源:pima-indians-diabetes

  2. 匯入資料前須簽確認檔案位置or匯入時設定好檔案從哪裡匯入:

import os
  • 查看路徑:
os.getcwd()
  • 更改檔案匯入位置(也可以將檔案複製到查看路徑時顯示的位置):
path = "檔案位置資料夾路徑"
os.chdir(path)
  1. 使用Pandas匯入檔案:
import pandas as pd
df = pd.read_csv("pima-indians-diabetes.csv")

分析數據及視覺化呈現

  1. 瀏覽檔案:
df.head()

https://ithelp.ithome.com.tw/upload/images/20240830/20168811oXCwwnUjBp.png
2. 查看基本統計結果:

df.describe()

https://ithelp.ithome.com.tw/upload/images/20240830/20168811IQ6MAB0LCk.png
3. 查看是否有缺失資料:

  • 查看缺失值:
df.isnull()

https://ithelp.ithome.com.tw/upload/images/20240830/20168811PYs6qeWrNv.png

df.notnull()

https://ithelp.ithome.com.tw/upload/images/20240830/20168811fIpgbX0G6P.png

  • 補缺失數值或過濾缺失欄位:
df.fillna(0) #缺失值補0
df.dropna()
  1. 分析數據各組間的相關性:
sns.heatmap(df.corrl())

https://ithelp.ithome.com.tw/upload/images/20240830/20168811W5PCWn6B1O.png
5. 數據散點圖:

sns.scatterplot(x = "Pregnancy", y = "Glucose", data = df)

https://ithelp.ithome.com.tw/upload/images/20240830/20168811u4JG2DNjig.png
6. Pairplot繪製散佈圖矩陣:

sns.pairplot(df, hue = "Diabetes")

https://ithelp.ithome.com.tw/upload/images/20240830/20168811u6sMleCK1B.png


上一篇
[Day8] Python資料視覺化-Matplotlib
下一篇
[Day10] Python應用-機器學習(Scikit-learn)-1
系列文
從零開始學Python30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言